Science of Science 서베이 보고서
과학을 과학하다: 데이터와 AI로 바라본 과학의 구조, 동역학, 그리고 미래
제1장 SciSci의 탄생과 네트워크 과학 기반
1.1 과학을 과학하다: SciSci의 기원
과학은 자연을 탐구하는 활동이지만, 과학 그 자체도 탐구의 대상이 될 수 있다. "과학의 과학(Science of Science, SciSci)"이라는 발상은 과학적 방법론을 과학 활동 자체에 적용하려는 시도에서 출발했다. 그 기원은 1960년대로 거슬러 올라간다. 1965년 Derek de Solla Price는 논문 간 인용 관계를 네트워크로 분석한 최초의 연구를 발표했다.[1]
Price는 인용 네트워크에서 "누적적 이점(cumulative advantage)" 현상을 발견했다. 이미 많이 인용된 논문이 더 많이 인용되는 경향, 즉 "부익부" 메커니즘이 과학 지식의 성장을 지배한다는 것이다. 이 통찰은 1976년 수학적으로 정식화되어, 이후 "선호적 연결(preferential attachment)"이라는 네트워크 과학의 핵심 개념으로 발전했다.[2]
그로부터 반세기가 지난 2018년, Barabási 등은 Science지에 SciSci 분야의 포괄적 리뷰를 발표하며 이 분야를 체계화했다. 이 리뷰는 논문 생산, 인용 동역학, 협력 패턴, 과학적 영향력의 예측 가능성이라는 네 축을 중심으로 SciSci의 지적 지형을 정리했으며, 컴퓨터 과학·물리학·사회학의 융합이 이 분야의 정체성을 형성하고 있음을 보였다.[3]
1.2 소세계 네트워크와 과학 협력의 구조
과학자들의 협력 관계는 어떤 구조를 이루고 있을까? 이 질문에 답하려면 네트워크 과학의 혁명적 발견을 이해해야 한다. 1998년, Watts와 Strogatz는 규칙적 격자와 완전 무작위 그래프 사이에 존재하는 "소세계(small-world)" 네트워크를 발견했다. 소세계 네트워크에서는 대부분의 노드가 소수의 단계만 거치면 연결되면서도, 동시에 높은 군집 계수를 유지한다. 이 모델은 영화배우 협업 네트워크(평균 3.65 단계), 전력망(18.7 단계), C. elegans 신경망(2.65 단계) 등에서 보편적으로 확인되었다.[4]
과학 협력 네트워크에도 소세계 속성이 나타났다. Newman은 물리학·생의학·컴퓨터과학 분야의 공저 네트워크를 분석하여, 과학자들이 평균 5-6단계의 분리도를 가지며 높은 군집성을 보임을 확인했다. 특히 생의학 분야의 군집 계수는 0.066으로, 동일 규모의 무작위 네트워크(0.00012)보다 550배 높았다. 이는 과학자들이 강한 지역적 공동체를 형성하면서도 분야 간 "다리" 역할을 하는 소수의 허브 연구자들을 통해 전체가 연결됨을 의미한다.[5]
1.3 척도 없는 네트워크와 허브 과학자
1999년, Barabási와 Albert는 현실 네트워크의 연결 분포가 멱법칙(power law)을 따른다는 사실을 발견했다. WWW의 페이지 연결도 분포가 P(k) ~ k-2.1을 따르며, 대부분의 노드는 소수의 연결만 갖지만 극소수의 "허브"는 수천 개의 연결을 보유한다. 이 "척도 없는(scale-free)" 구조는 "선호적 연결" 메커니즘—새 노드가 이미 연결이 많은 노드에 우선적으로 연결되는 현상—으로 설명되었다.[6]
과학 협력 네트워크의 진화를 추적한 연구는 이 메커니즘이 학문 세계에서도 작동함을 보여주었다. 수학과 신경과학 분야의 8년간 공저 데이터를 분석한 결과, 새로운 협력 관계가 형성될 때 이미 많은 공저자를 가진 과학자에게 연결될 확률이 비례적으로 높았다. 네트워크는 시간이 지남에 따라 거대 연결 성분(giant component)으로 수렴했으며, 이 거대 성분에 속한 과학자들의 평균 거리는 지속적으로 감소했다.[7]
1.4 팀 과학으로의 전환
네트워크 구조의 이해를 넘어, SciSci의 핵심 발견 중 하나는 과학의 생산 방식 자체가 근본적으로 변화하고 있다는 것이다. 1950년대 이후 과학·공학 전 분야에서 팀 기반 연구의 비중은 꾸준히 증가했다. 450만 편의 논문과 210만 건의 특허를 분석한 결과, 팀 논문의 비율은 과학에서 약 50%에서 80% 이상으로, 공학에서는 60%에서 90% 이상으로 상승했으며, 팀 논문의 평균 인용 횟수는 단독 연구의 2.1배에 달했다.[8]
팀 과학으로의 전환은 "지식의 부담(burden of knowledge)" 가설과 깊이 연결된다. 과학 지식이 축적될수록 개별 연구자가 전문성을 확보하기까지 필요한 학습 기간이 길어지고, 자연스럽게 협업의 필요성이 증가한다. 미국 특허 데이터 분석에서 첫 특허를 출원하는 평균 연령은 1985년 30.7세에서 2009년 33.7세로 상승했으며, 팀 규모도 동기간 동안 꾸준히 증가했다.[9]
팀의 규모 분포 자체도 흥미로운 패턴을 보인다. APS 논문 데이터베이스를 분석한 결과, 팀 규모 분포는 단일 분포가 아닌 두 개의 포아송 분포의 중첩으로 나타났다. 소규모 핵심 팀(2-4명)과 대규모 프로젝트 팀(10명 이상)이라는 두 가지 뚜렷한 협업 모드가 공존하며, 이는 과학 연구에 "탐색형"과 "대규모 검증형"이라는 본질적으로 다른 두 유형이 있음을 시사한다.[10]
팀의 구조를 넘어, 개인 수준에서도 과학적 성취의 시간적 역학이 밝혀지고 있다. 흥미롭게도 과학적 성취에도 스포츠 선수의 "핫 스트릭"과 유사한 패턴이 존재한다. 수십만 명의 경력 데이터를 분석한 결과, 과학자·영화감독·예술가 모두에서 연속적으로 높은 영향력의 작품을 만들어내는 "핫 스트릭" 기간이 통계적으로 유의하게 나타났다. 이 기간은 무작위가 아니며, 경력 중 언제든 발생할 수 있지만 대부분의 경우 단 한 번 집중적으로 나타났다.[11]
| 연도 | 발견/개념 | 핵심 기여 | 주요 연구자 |
|---|---|---|---|
| 1965 | 인용 네트워크 | 논문 간 인용을 네트워크로 최초 분석 | Price |
| 1976 | 누적적 이점 | 부익부 현상의 수학적 정식화 | Price |
| 1998 | 소세계 네트워크 | 높은 군집성 + 짧은 경로 길이의 공존 | Watts & Strogatz |
| 1999 | 척도 없는 네트워크 | 멱법칙 분포와 선호적 연결 메커니즘 | Barabási & Albert |
| 2001 | 공저 네트워크 분석 | 과학 협력의 소세계 속성 확인 | Newman |
| 2007 | 팀 과학의 부상 | 팀 논문 비율 50%→80%, 인용 2.1배 | Wuchty, Jones, Uzzi |
| 2009 | 지식의 부담 | 전문화 심화와 협업 필요성 증가 | Jones |
| 2018 | SciSci 체계화 | 분야 전체를 포괄하는 종합 리뷰 | Barabási et al. |
- 데이터 편향: 영어권·고영향력 저널 중심의 데이터는 글로벌 과학 활동의 일부만 포착한다.
- 인과 추론의 한계: 관찰 데이터에서 인과 관계를 식별하기 어렵다. 협력이 성과를 높이는가, 성과가 높은 사람이 협력하는가?
- 측정의 환원성: h-지수, 인용 수 등 단일 지표로 과학적 기여의 다면적 가치를 포착할 수 있는가?
- 재현성: SciSci 자체의 발견도 재현 가능한가? 데이터 시기·범위에 따라 결론이 달라질 수 있다.
제2장 과학 측정의 혁신
2.1 인용 분석의 탄생과 h-지수 혁명
과학적 영향력을 수치로 측정하려는 시도는 1972년 Eugene Garfield의 선구적 연구에서 시작되었다. Garfield는 저널 수준에서 인용 빈도를 체계적으로 집계하는 방법론을 제안했으며, 이것이 오늘날 Journal Impact Factor(JIF)의 원형이 되었다. 하나의 저널에 실린 논문이 이후 2년간 평균적으로 받는 인용 수라는 단순한 정의가 학술 출판의 위계 전체를 지배하게 될 줄은 당시 아무도 예상하지 못했다.[12]
저널 수준의 측정을 넘어 개인 연구자의 영향력을 단일 숫자로 요약하려는 시도는 2005년 물리학자 Jorge Hirsch가 제안한 h-지수에서 결정적 전환점을 맞았다. h-지수는 "h편의 논문이 각각 h회 이상 인용된" 최대 h값으로 정의된다. 예컨대 h=50인 연구자는 최소 50편의 논문이 각각 50회 이상 인용된 것이다. 이 지표는 단일 대표작의 인용 폭발에 휘둘리지 않으면서도 지속적 기여를 반영한다는 점에서 직관적이었다.[13]
h-지수의 한계를 보완하려는 시도도 이어졌다. g-지수는 상위 논문의 인용 수를 더 세밀하게 반영한다. 상위 g편 논문의 총 인용 수가 g2 이상인 최대 g값으로 정의되며, 고인용 논문이 많은 연구자에게 h-지수보다 높은 값을 부여한다. 분야 간 비교를 가능하게 하려는 시도로 RCR(Relative Citation Ratio)도 등장했다. NIH가 개발한 이 지표는 같은 분야의 인용 네트워크를 기준으로 정규화하여, 분야 간 인용 관행 차이를 보정한다.[14]
2.2 혁신성 측정: CD 지수와 그 논쟁
인용 횟수가 "얼마나 많이" 주목받았는지를 측정한다면, CD 지수(Consolidation-Disruption index)는 "어떻게" 영향을 미쳤는지를 포착하려는 시도이다. 2017년 Funk와 Owen-Smith가 기술 혁신 맥락에서 제안한 이 지표는, 어떤 논문이 기존 지식을 "공고화(consolidation)"하는지 아니면 "파괴(disruption)"하는지를 -1에서 +1 사이로 수치화한다. +1에 가까울수록 이전 문헌과의 단절이 크고, -1에 가까울수록 기존 연구의 연장선상에 있다.[15]
이 지표가 전 세계적 논쟁을 촉발한 것은 2023년 Nature에 발표된 대규모 분석 때문이었다. 4,500만 편의 논문과 390만 건의 특허를 분석한 결과, CD 지수가 1945년부터 2010년까지 전 분야에 걸쳐 급격히 하락했다. 물리학에서 91.9%, 생명과학에서 91.2%의 감소가 관측되었다. 이 결과는 "과학이 점점 덜 파괴적으로 변하고 있다"는 도발적 해석으로 이어졌다. 연구자들이 점점 더 좁은 범위의 선행 연구에 의존하고, 지식의 프런티어가 멀어짐에 따라 진정한 패러다임 전환이 어려워지고 있다는 것이다.[16]
2.3 잠자는 숲속의 미녀: 지연된 인정
과학적 발견이 항상 즉각적으로 인정받는 것은 아니다. "잠자는 미녀(Sleeping Beauty)" 현상은 발표 후 오랫동안 거의 인용되지 않다가 갑자기 "깨어나" 폭발적 인용을 받는 논문을 지칭한다. Ke 등이 제안한 Beauty coefficient B는 이 현상을 정량화했다. 2,200만 편의 물리학·화학·사회과학 논문을 분석한 결과, 잠자는 미녀는 드물지 않았다. "잠자는 기간"이 수십 년에 달하는 사례가 다수 발견되었으며, 가장 극단적 사례는 117년간 잠자다가 깨어난 물리학 논문이었다.[17]
과학적 영향력의 장기 역학을 더 정교하게 모델링한 시도도 있다. Wang, Song, Barabási의 Q-모델은 논문의 인용 궤적을 세 가지 요인으로 분해했다: 논문 고유의 "적합성(fitness)", 발표 시점의 "즉시성(immediacy)", 그리고 시간에 따른 "노화(aging)". 이 모델은 과학적 영향력에서 "운(luck)"과 "실력(fitness)"의 상대적 기여를 정량적으로 분리할 수 있게 해주었다. 흥미롭게도, 논문의 궁극적 인용 수는 적합성보다 초기 인용의 무작위적 변동에 더 민감한 것으로 나타났다.[18]
2.4 인용 불평등과 출판 독과점
과학 측정의 혁신이 가져온 이면에는 깊어지는 불평등이 있다. 인용 분포의 불균등은 시간이 지남에 따라 심화되고 있다. 1980년부터 2020년까지의 데이터를 분석한 결과, 상위 1%의 고인용 논문이 전체 인용의 약 21%를 차지하며, 이 비율은 지난 40년간 증가 추세에 있다. 지니 계수로 측정한 인용 불평등도 대부분의 학문 분야에서 상승했다.[19]
출판 시장의 구조적 독과점도 과학 생태계의 핵심 과제이다. Elsevier, Springer Nature, Wiley, Taylor & Francis, SAGE의 5대 출판사가 전체 학술 논문의 약 53%를 출판하며, 특히 사회과학에서는 이 비율이 70%에 달한다. 이러한 집중은 1973-2013년 기간 동안 지속적으로 심화되었으며, 디지털 시대에도 완화되지 않았다.[20]
출판 시장의 집중이 접근의 불평등을 야기한다면, 연구자 자체의 인구학적 불평등은 더 근본적이다. 성별에 따른 과학 생산성의 격차가 측정을 통해 가시화되었다. 전 세계 논문 데이터를 분석한 결과, 여성 연구자의 비율은 분야에 따라 크게 다르지만 대부분의 분야에서 30% 미만이며, 특히 고인용 논문과 교신저자 비율에서 격차가 두드러졌다. 이러한 격차는 남미와 동유럽에서 상대적으로 작았고, 일본과 사우디아라비아에서 가장 컸다.[21]
과학의 규모 자체도 전례 없는 속도로 성장하고 있다. Web of Science 데이터 분석에 따르면, 과학 출판물의 수는 매 15-20년마다 2배로 증가해왔다. 이 지수적 성장은 20세기 초부터 현재까지 놀라울 정도로 일관적이다. 한편, 개인 연구자의 인용 지표를 분야 간 비교할 수 있도록 표준화하려는 노력도 진행 중이며, 700만 명 이상의 연구자를 포함하는 표준화된 인용 데이터베이스가 구축되어 활용되고 있다.[22]
| 지표 | 제안연도 | 측정 대상 | 핵심 장점 | 주요 한계 |
|---|---|---|---|---|
| JIF | 1972 | 저널 영향력 | 단순하고 직관적 | 저널 내 논문 간 편차 무시 |
| h-지수 | 2005 | 개인 생산성+영향력 | 생산성과 인용을 동시 반영 | 분야 간 비교 불가, 경력 길이 편향 |
| g-지수 | 2006 | 개인 영향력 (상위 집중) | 고인용 논문 가중 반영 | h-지수보다 복잡, 보급률 낮음 |
| CD 지수 | 2017 | 논문의 혁신성/공고성 | 영향력의 "질적" 차원 포착 | 계산 복잡, 해석 논쟁 중 |
| RCR | 2016 | 분야 보정 인용 | 분야 간 공정 비교 가능 | NIH 중심, 인용 네트워크 의존 |
| Beauty B | 2015 | 지연된 인정 | 잠자는 미녀 현상 정량화 | 희귀 사건에 최적화, 일반화 한계 |
- Goodhart의 법칙: 측정 지표가 목표가 되면 좋은 측정 지표가 되기를 멈춘다. h-지수 최적화를 위한 자기인용, 상호인용 네트워크가 문제화.
- 분야 간 비교 불가: 수학(평균 인용 ~5)과 생의학(평균 인용 ~30)을 동일 지표로 비교하면 구조적 불공정 발생.
- 시간 편향: 최근 논문은 인용 축적 시간이 부족하여 체계적으로 불리. CD 지수의 시계열 감소도 이 편향에 부분적으로 기인할 수 있음.
- 다면적 가치의 환원: 교육적 기여, 데이터 공유, 소프트웨어 개발, 정책 자문 등 인용으로 포착되지 않는 과학적 기여가 체계적으로 무시됨.
제3장 과학 지식의 구조
3.1 인용 분포의 보편성
개별 논문의 인용 수는 분야마다 천차만별이지만, 인용 분포의 통계적 형태에는 놀라운 보편성이 존재한다. 물리학·화학·생물학 등 다양한 분야의 인용 데이터를 분석한 결과, 각 분야의 인용 분포를 해당 분야의 평균 인용 수로 정규화하면 모든 분야가 단일 보편 곡선으로 수렴했다. 이는 인용의 절대적 규모는 분야마다 다르지만, 그 이면의 통계적 메커니즘은 동일하다는 것을 의미한다. 소수의 고인용 논문이 전체 인용의 대부분을 차지하는 "멱법칙적" 패턴이 학문 분야를 초월하여 보편적으로 나타난다.[23]
이러한 보편성은 과학 지식의 성장 메커니즘에 대한 근본적 통찰을 제공한다. 인용 과정에서 "선호적 연결"과 "적합성"이 동시에 작용하며, 논문의 궁극적 운명은 출판 직후의 초기 인용 역학에 의해 상당 부분 결정된다. 한편, 개별 과학자에 대한 공헌 배분도 구조적 패턴을 보인다. 다저자 논문에서 신용(credit)이 어떻게 분배되는지를 분석한 결과, 첫 번째 저자와 마지막 저자(통상 교신저자)가 불균형적으로 많은 신용을 받으며, 중간 저자의 기여는 체계적으로 과소평가되는 것으로 나타났다.[24]
3.2 과학 지도 시각화
과학 지식의 전체 지형을 볼 수 있어야 한다. 수백만 편의 논문이 형성하는 인용 네트워크를 시각적으로 매핑하려는 시도는 과학의 거시적 구조를 드러낸다. VOSviewer는 이러한 시각화 도구의 대표적 사례로, 공인용(co-citation) 분석, 서지 결합(bibliographic coupling), 키워드 공출현 분석 등을 통해 연구 분야 간 관계를 2차원 지도로 표현한다. 출시 이후 누적 200만 회 이상 다운로드되며 과학 매핑의 사실상 표준 도구로 자리잡았다.[25]
VOSviewer가 드러낸 전체 지형을 더 체계적으로 분류하려는 시도도 이어졌다. UCSD 과학 지도 프로젝트는 Scopus와 Web of Science의 2,500만 편 이상의 논문 데이터를 기반으로 554개의 학문 하위 분야를 13개 주요 클러스터로 매핑했다. 이 지도에서 물리학과 수학은 서로 인접하고, 사회과학과 의학은 별도의 대륙을 형성하며, 컴퓨터과학은 공학과 수학 사이의 "다리" 역할을 한다.[26]
지형을 보여준다면 읽어내는 것은 또 다른 과제이다. 공인용과 직접 인용, 서지 결합이라는 세 가지 접근법을 비교한 연구에 따르면, 연구 프런티어를 가장 정확하게 포착하는 것은 직접 인용 방식이었다. 공인용 분석은 과거의 확립된 구조를, 서지 결합은 현재의 활발한 연구 영역을 더 잘 반영했다. 이 세 방법의 조합이 과학 구조의 시간적 변화를 입체적으로 이해하는 데 필수적이다.[27]
3.3 커뮤니티 구조와 토픽 모델링
과학 지식 네트워크의 구조를 이해하는 또 다른 접근은 커뮤니티 탐지(community detection)이다. 복잡계 네트워크에서 커뮤니티란 내부 연결이 외부 연결보다 밀도가 높은 노드 그룹을 뜻한다. Fortunato의 포괄적 리뷰는 모듈성(modularity) 최적화, 스펙트럼 방법, 레이블 전파 등 수십 가지 알고리즘을 체계적으로 비교 분석했으며, 이 리뷰 자체가 1만 회 이상 인용되어 네트워크 과학에서 가장 영향력 있는 논문 중 하나가 되었다.[28]
대규모 네트워크에서 실용적으로 사용할 수 있는 커뮤니티 탐지 알고리즘의 대표적 사례가 Louvain 방법이다. 이 알고리즘은 모듈성을 탐욕적으로(greedily) 최적화하면서 계층적으로 커뮤니티를 병합하는 다단계 접근법을 사용한다. 계산 복잡도가 O(n log n)으로 매우 효율적이어서 수백만 노드의 네트워크도 처리할 수 있으며, 인용 네트워크, 공저 네트워크, 소셜 네트워크 등 다양한 도메인에서 사실상의 표준으로 사용된다.[29]
네트워크 구조 분석과 자연어 처리를 결합한 새로운 접근법도 등장했다. 인용 네트워크 위에 토픽 모델(topic model)을 결합하면 논문의 주제적 유사성과 인용 관계를 동시에 고려할 수 있다. 이 네트워크 기반 토픽 모델은 전통적인 LDA보다 과학 분야의 진화를 더 정확하게 추적할 수 있었으며, 특히 학제 간 연구의 흐름을 포착하는 데 강점을 보였다.[30]
3.4 오픈 데이터 인프라의 혁명
과학 지식 구조의 분석은 데이터 인프라의 발전 없이는 불가능하다. 2020년에 공개된 S2ORC(Semantic Scholar Open Research Corpus)는 8,100만 편 이상의 학술 논문에 대한 전문 텍스트, 메타데이터, 인용 관계를 포함하는 대규모 오픈 데이터셋이다. 이는 자연어 처리와 과학 측정학의 교차점에서 새로운 연구를 가능하게 한 핵심 인프라가 되었다.[31]
더 야심적인 시도로, OpenAlex는 Microsoft Academic Graph의 후속 프로젝트로서 2억 편 이상의 학술 저작물, 6천만 명의 연구자, 10만 개의 출처를 포괄하는 완전 오픈 인덱스이다. 기존의 상업적 데이터베이스(Web of Science, Scopus)와 달리 무료로 접근할 수 있으며, API와 데이터 스냅샷을 통해 대규모 과학 측정학 연구의 민주화에 기여하고 있다. 오픈 액세스(OA)의 확산도 이러한 변화의 일부이다. 2018년 기준 전체 논문의 약 28%가 어떤 형태로든 OA로 제공되고 있으며, Green OA(저자 자체 아카이빙)가 가장 큰 비중을 차지했다.[32]
| 데이터 인프라 | 공개연도 | 규모 | 특징 | 접근성 |
|---|---|---|---|---|
| Web of Science | 1964 | ~2억 건 | 가장 오랜 역사, 엄격한 저널 선별 | 상업적 (유료) |
| Scopus | 2004 | ~2.5억 건 | 넓은 커버리지, Elsevier 운영 | 상업적 (유료) |
| S2ORC | 2020 | 8,100만+ | 전문 텍스트 포함, NLP 연구 최적화 | 오픈 (무료) |
| OpenAlex | 2022 | 2억+ | MAG 후속, 완전 오픈, API 제공 | 오픈 (무료) |
| VOSviewer | 2010 | N/A | 시각화 도구, 200만+ 다운로드 | 오픈 (무료) |
- 데이터 완전성: 어떤 단일 데이터베이스도 전체 과학 출판물을 포괄하지 못한다. 비영어권, 사회과학, 인문학의 누락이 체계적.
- 동적 분류의 어려움: 학문 분야의 경계는 고정되어 있지 않다. 새로운 학제 간 분야의 등장을 기존 분류 체계가 따라가지 못함.
- 인용 시차와 편향: 인용에는 시간이 걸리며, 방법론 논문이 실질적 발견 논문보다 더 많이 인용되는 구조적 편향이 존재.
- 스케일의 저주: 수억 편의 논문 데이터를 처리하려면 계산 비용이 막대하며, 실시간 분석은 여전히 도전적.